AI资讯新闻榜单内容搜索-AI 大模型

这家创业公司发现了大模型的一个根本性缺陷

你有没有想过，我们每天用的 AI 大模型，可能在某些词汇上天生就有缺陷？不是因为训练数据不够，不是因为算力不足，而是因为语言本身的规律——那些用得少的词，模型就是学不好。更让人意外的是，这个问题早在 2025 年就被一家中国创业公司系统性地发现并解决了。

来自主题: AI技术研报

7262 点击 2026-05-28 09:52

独家｜ChatGPT核心贡献者姜旭归国创业：把LLM的Scaling带到具身智能

姜旭是少数完整参与过 OpenAI 大模型核心技术演进的华人创业者之一。2019 至 2023 年间，他经历了 GPT 系列能力爆发最关键的阶段，工作横跨底层训练 infra、大规模预训练、RLHF 对齐算法与数据构建等核心链路。

来自主题: AI资讯

10872 点击 2026-05-22 10:26

国产大模型杀疯了，MiniMax-M2.5即将开源！

这两天 AI 圈真的太热闹了，就在网传 DeepSeek 要更新支持 100 万 Token 上下文的新模型时，MiniMax 率先冲锋，更新了他们的新旗舰模型：MiniMax-M2.5。更有意思的是，国外网友这段时间对国内 AI 大模型的更新节奏格外关注，他们甚至把这种争先更新的现象称为：Happy Chinese new year！

来自主题: AI资讯

11335 点击 2026-02-12 18:07

决定了：过年攻略全都不过脑子，让AI去想

春节还没到，「过年的气氛」已经渗入科技圈每个人的毛孔。单说 AI 大模型这一块，刚刚发布的有 kimi 2.5 和 Step 3.5 Flash，即将发布的据说还有 DeepSeek V4，GPT-5.3、Claude Sonnet 5、Qwen 3.5，GLM-5，说不定一觉醒来，现有的技术就要被颠覆。

来自主题: AI技术研报

6884 点击 2026-02-12 15:32

中兴发了一篇论文，洞察AI更前沿的探索方向

当大模型参数量冲向万亿级，GPT-4o、Llama4 等模型不断刷新性能上限时，AI 行业也正面临前所未有的瓶颈。Transformer 架构效率低、算力消耗惊人、与物理世界脱节等问题日益凸显，通用人工智能（AGI）的实现路径亟待突破。

来自主题: AI技术研报

8502 点击 2025-11-26 13:47

当 AI 开始分「左右」

人类的下一个分裂，从算法开始。作者｜Moonshot 编辑｜靖宇在生成式 AI 的早期叙事里，AI 大模型曾被描绘得理性、冷静、无偏见。然而，不到三年时间，这个叙事迅速崩塌。事实正在变得越来越清

来自主题: AI资讯

9855 点击 2025-11-16 13:22

华为云的组合新范式，引爆了Agentic AI应用革命

今年是 AI 大模型的落地关键年。大模型技术在快速进步，但行业落地仍面临三大痛点：开发门槛高、场景碎片化、端侧能力有限。结合 AI 能力与云计算，在 CGC2025 大会上，华为云提出的 Versatile 智能体平台与 CloudDevice 云终端协同，正致力于破解这些难题。

来自主题: AI资讯

8387 点击 2025-11-08 11:19

对话杨红霞：从大厂到创业，她希望做出下一个OpenAI

杨红霞，是中国大模型领域一个无法绕开的名字。人们从 M6 模型（阿里达摩院发布的万亿参数 AI 大模型）开始熟知她，而她又在最近走出创业隐匿模式，正式向世界宣告自己已经是一名创业者，并希望能够做出下一

来自主题: AI资讯

9753 点击 2025-11-07 15:05

中美AI炒币炒股阶段战果出炉：DeepSeek与Qwen稳健致胜，Gemini高频交易策略失效

近日，号称是首个专注于金融市场的 AI 实验室的美国实验室 Nof1 启动了一个将多个 AI 大模型置于真实金融市场中进行自动化交易对决的实验平台。这一项目的名称叫做 Alpha Arena，它是一个

来自主题: AI资讯

11273 点击 2025-10-28 08:15

我让 Kimi 的新 Agent 给我做国庆攻略，跟着 AI 旅游会踩雷吗？

国庆长假，AI 大模型献礼的方式是一波接一波的更新。OpenAI 突然发布 Sora2，DeepSeek 更新了 V3.2，智谱更新了 GLM-4.6，Kimi 则是更新了 App，然后默默在自己的版本记录里面，写下了这句话。

来自主题: AI资讯

9464 点击 2025-10-08 11:20